La prise en compte de la dimension temporelle dans la classification de données
نویسندگان
چکیده
Résumé. Dans un contexte d’ingénierie de la connaissance, l’analyse des données relationnelles évolutives est une question centrale. La représentation de ce type de données sous forme de graphe optimisé en facilite l'analyse et l'interprétation par l’utilisateur non expert. Cependant, ces graphes peuvent rapidement devenir trop complexes pour être étudiés dans leur globalité, il faut alors les décomposer de manière à en faciliter la lecture et l’analyse. Pour cela, une solution est de les simplifier, dans un premier temps, en un graphe réduit dont les sommets représentent chacun un groupe distinct de sommets : acteurs ou termes du domaine étudié. Dans un second temps, il faut les décomposer en instances (un graphe par période) afin de prendre en compte la dimension temporelle. La plateforme de veille stratégique Tétralogie, développée dans notre laboratoire, permet de synthétiser les données relationnelles évolutives sous forme de matrices de cooccurrence 3D et VisuGraph, son module de visualisation, permet de les représenter sous forme de graphes évolutifs. VisuGraph assimile les différentes périodes à des repères temporels et chaque sommet est placé en fonction de son degré d’appartenance aux différentes périodes. Ce prototype est aussi doté d’un module de la classification interactive de données relationnelles basé sur une technique de Markov Clustering, qui conduit à une visualisation sous forme de graphe réduit. Nous proposons ici de prendre en compte la dimension temporelle dans notre processus de classification des données. Ainsi, par la visualisation successive des différentes instances, il devient plus facile d’analyser l’évolution des classes au niveau intra mais aussi au niveau inter classes.
منابع مشابه
Modélisation intégrée de la dynamique des systèmes d'information décisionnels
Résumé. Les systèmes d’information décisionnels (SID) sont des systèmes d’information (SI) qui ont pour objectif de faciliter la prise de décision à partir d’information résultant de processus complexes de dérivation et de préparation des données de SI sources. Ces processus sont généralement peu modélisés et sont directement implantés avec des logiciels spécifiques au cours des projets décisio...
متن کاملLisibilité et recherche d'information : vers une meilleure accessibilité
RÉSUMÉ. Dans cet article, nous proposons en premier lieu une mesure de la lisibilité adaptée à des lecteurs dyslexiques en utilisant des caractéristiques issues d’une analyse fine des causes des difficultés de lectures rencontrées. Nous proposons ensuite un cadre pour la prise en compte de la lisibilité dans la mesure de pertinence accordée par les systèmes de recherche d’informations, qui est ...
متن کاملPanorama de travaux autour de l'intégration de données spatio-temporelles dans les hypercubes
Résumé : Cet article présente un panorama des différents travaux qui sont effectués dans notre équipe autour de l’intégration des données spatiotemporelles dans les entrepôts de données et les hypercubes. Nous nous sommes plus particulièrement intéressés à la prise en compte des évolutions dans les dimensions spatiales, à la modélisation multidimensionnelle de données continues et à la concepti...
متن کاملApprentissage actif d'émotions dans les dialogues Homme-Machine
Résumé. La prise en compte des émotions dans les interactions Homme-machine permet de concevoir des systèmes intelligents, capables de s’adapter aux utilisateurs. Les techniques de redirection d’appels dans les centres téléphoniques automatisés se basent sur la détection des émotions dans la parole. Les principales difficultés pour mettre en œuvre de tels systèmes sont l’acquisition et l’étique...
متن کاملDéfinition et diffusion de signatures sémantiques dans les systèmes pair-à-pair
Résumé. Les systèmes pair-à-pair (peer-to-peer, P2P, égal-à-égal) se sont popularisés ces dernières années avec les systèmes de partage de fichiers sur Internet. De nombreuses recherches concernant l’optimisation de la localisation des données ont émergé et constituent un axe de recherche très actif. La prise en compte de la sémantique du contenu des pairs dans le routage des requêtes permet d’...
متن کامل